查看原文
其他

正则篇(七):用正则检查译文质量

可爱的冬梅 职业译员玩转翻译技术
2024-09-09

在进行翻译项目管理的时候,我们经常关注的两个比较重要的点:翻译质量翻译效率

通过前面几章的讲解,我们看到,在进行查找替换和文件准备时,利用正则,可以提高翻译项目管理效率。那翻译质量呢,正则会有帮助吗?有什么帮助呢?

今天我们就来看看,正则如何帮助检查译文质量的。

为什么需要检查译文质量?

在进行翻译项目管理时,项目经理通常会提前列一个check list,在CAT中,这个工具叫QA checker

这些QA可能包含术语一致性、原文和译文的长度比例限制、上下文的一致性、目标语言的数字和大小写以及格式规范等。比如下图所见的错误:

通过QA checker,CAT工具本身可以在译员翻译的过程中自动提示质量错误

其实这就是项目经理制定的译文质量标准,每一条标准都可能有对应的代码,如果有问题,工具可以按照这个标准把错误和问题标记出来,这样译员就知道“哦,原来这句话我犯了这个错误。我需要按照提示纠正这样我的译文才符合规范。”

可是有的时候,我们的质量标准可能不止这么简单。比如:

  • 数字和缩写单位之间的空格是否准确使用

  • 不同语言之间的习惯语序差异

  • 等等

针对这些问题,我们就可以通过正则表达式,检查出无法进行设置的质量错误。

我们一起来看几个案例。

数字和缩写单位之间的空格是否准确使用

数字和缩写单位之间的空格要取决于目标语言的规范。

案例一:25cm、25 cm, 25°cm

按常见风格手册规定,在汉译英时,数字和缩写单位之间要有一个空格。秒(s)、角度、温度及百分号除外。

但是有时候原文可能不规范,比如25cm、25 cm, 25°cm,即使如此,我们也要规范译文的表达:数字+空格+度量衡单位。我们就可以试用以下正则:

  • 原文中查找:(\d+)\s*cm

  • 译文中检查:$1 cm

若没有按照标准表述,我们就会得到一个来自QA的警告提示。

只有按照准确的译文修改完成后,错误的警告提示才会消失。

当然,如果担心其他度量衡出现,可以你能想到的度量衡一起考虑进来。正则只需要用|把各个度量衡隔开就好了。(你可以自己尝试一下~)

案例二:25% or 25 %

在法语中,百分号必须以不间断的空格隔开。

  • 原文中查找:(\d+)%

  • 译文中检查:$1 %

同样,若没有按照标准表述,就会有警告提示。

不同语言之间的习惯表达差异

语言的表达习惯要根据目标语言的标准随之发生变化。

案例三:长**

在表达尺寸的时候,中文习惯了“长**高”的顺序,可如果翻译为美国英语,需要处理为“Height x Width x Depth”。

  • 原文中查找:长\*宽\*高

  • 错误译文:\(H x W x D\)

若没有按照标准翻译,就会有警告提示。

按照准确的译文修改完成后,警告提示即可消失。


案例四:25% or %25

在土耳其语和其他突厥语中,百分号位于数字前,而不是其后,且中间没有空格。所以,为了满足这一标准规范,我们就需要进行检查:

  • 原文中查找:(\d+)%

  • 译文中检查:%$1

若没有按照标准翻译,就会有警告提示。

按照准确的译文修改完成后,警告提示即可消失。

案例五:~ or -

英文不使用顿号、书名号、波浪线、6个点的省略号等符号,所以在翻译的时候要特别注意。例如,如果检查波浪线是否在英文译文中存在,就可以使用以下正则

  • 原文中查找:(.+?)~(.+?)

  • 译文中检查:$1-$2

若没有按照标准翻译,就会有警告提示。

按照准确的译文修改完成后,警告提示即可消失。

案例六:日期的译文

不同目标语言可能有不同的日期表达。我们依然可以借助正则检查日期是否符合规范。如:

原文:2021/11/29

译文:11/29/2021

则可以使用:

  • 原文中查找:(\d+)\/(\d+)\/(\d+)

  • 译文中检查:$2\/$3\/$1

若希望的原文与译文为:

原文:11/29/2021

译文:2021年11月29日

则可以使用:

  • 原文中查找:(\d+)\/(\d+)\/(\d+)

  • 译文中检查:$3年$1月$2日

当然,还有其它日期表达方式,你可以根据自己需求进行检查和调整。

设置正则警告条件

当然,在利用正则表达式进行检查的时候,我们还可以根据需求正则的警告条件,比如:

  • 原文译文中均有禁用的正则表达式匹配

  • 译文中有缺失的正则表达式匹配

  • 译文中有禁用的正则表达式匹配

  • 正则表达式计数不同

  • 译文中正则表达式替换缺失

  • 等等

借助正则,我们就可以很“轻松”地解决那些自带QA检查不出来的问题啦~

当然如果不太熟悉正则,可能也没那么轻松~

不过,总是要先试试嘛不是?

好啦这期正则篇先到这里,你还想学什么,欢迎来问~


往期精选

正则篇(六):用正则将文本标记为标签

正则篇(五):用正则进行文本解析

正则篇(四):源文件准备

正则篇(三):用正则在CAT中查找和替换

正则篇(二):如何写一个正则表达式

正则篇(一):认识正则表达式

继续滑动看下一个
职业译员玩转翻译技术
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存